强化学习之父Richard Sutton最新采访:LLM是“死路一条”
图灵奖获得者Richard Sutton,强化学习之父最新采访,认为当前热门的大语言模型是一条死胡同。他的核心观点是,LLMs 的架构从根本上缺乏从实际互动(on-the-job)中持续学习的能力。无论我们如何扩大其规模,它们本质上仍然是在模仿人类数据,而不是
图灵奖获得者Richard Sutton,强化学习之父最新采访,认为当前热门的大语言模型是一条死胡同。他的核心观点是,LLMs 的架构从根本上缺乏从实际互动(on-the-job)中持续学习的能力。无论我们如何扩大其规模,它们本质上仍然是在模仿人类数据,而不是
当AI圈还在讨论大语言模型(LLM)参数竞赛的瓶颈时,Meta重组AI部门后的首个重磅研究,Code World Model(CWM)横空出世。
2025年9月,马斯克旗下xAI推出的Grok-4-fast直接把有“路由器”加持的GPT5给比下去了,这事在AI圈直接炸了锅,大家一开始都觉得,肯定是马斯克又砸钱堆显卡了,毕竟之前AI要快,基本都是靠加算力硬堆。但后来扒了扒细节才发现,这事可能跟英伟达的算法
人类大脑能够从视觉输入中提取复杂的信息,包括物体、它们的空间与语义关系,以及与环境的互动。然而,长期以来,缺乏一种量化方法来刻画这种复杂信息。本研究探讨了大语言模型(LLM)所编码的上下文信息是否有助于建模大脑从自然场景中提取的复杂视觉信息。研究团队发现,将自
AI调用模式是目前最广泛、最成熟的AI应用形式。其核心价值在于将大型语言模型(LLM)强大的自然语言理解和生成能力,封装成一个可按需调用的黑盒服务,以解决边界清晰、输入输出明确的原子化任务。这种模式的成功关键在于精准——通过精确的提示词获得可预测、高质量的响应
导读易彤老师是中国电信人工智能研究院算语义算法工程师。她深度参与了 telechat 大模型通用 Chat 能力的研发,以及后训练的一些优化的工作。本次演讲介绍如何去提升 LLM 基础的 Function Call 能力,系统性的阐述从数据维度及训练维度两个方
AI 能否大规模生成真正相关的答案?我们如何确保它理解复杂的多轮对话?我们如何防止它轻率地吐出错误的事实?这些都是现代 AI 系统面临的挑战,尤其是使用 RAG 构建的系统。RAG 将文档检索的强大功能与语言生成的流畅性相结合,使系统能够基于上下文感知、基于事
在早期的大语言模型应用中,提示工程是连接用户意图与模型输出的核心手段。然而,纯提示驱动的方案在多步推理、工具调用和动态环境交互中常显不足。传统大语言模型存在三大固有局限:知识时效性不足(无法获取实时信息)、计算能力受限(难以处理复杂计算)以及无法与环境交互(缺
在数据驱动的时代,大量有价值的信息隐藏在非结构化文本中—比如详尽的临床记录、冗长的法律文件、大量客户反馈与评价等。很多时候我们需要把其抽取成更结构化的内容。这是因为结构化信息:更易于被索引与查询、更适合统计分析与挖掘,也更易于被软件集成(RPA、API、工作流
谷歌 llm 轻量 langextract attribut 2025-08-19 19:48 4
从2018年GPT架构诞生至今,七年时间里,大语言模型(LLM)已经从实验室走向了日常。当我们对比2019年的GPT-2和2025年的DeepSeek-V3、Llama 4时,会惊讶地发现:它们的核心骨架依然是Transformer,但"血肉"早已天翻地覆。
2023伊始的一波人工智能高潮,把人工智能推向了人类生活的方方面面。随着ChatGPT、DeepSeek为代表的LLM大模型崛起人工智能确实已经逐渐地改变了我们的生活、学习和工作。人们只需一个提示词,几秒钟一幅创作图,一篇文章就搞定了。然而只需乍看一眼需阅,我
疯狂挖人的Meta,终于在今天发布了最新AI研发成果!代码世界模型CWM是本次发布的模型,创新性地将世界模型引入了代码生成任务中。这是否会成为编程模型新范式?
SIEM-MiiND星智神盾是中企通信自建的智能安全信息及事件管理(SIEM)平台,采用前沿人工智能技术,综合提升智能安全运作中心(AI SOC)整体效能,提供更快、更准的全天候安全监控、威胁分析与事件回应服务。
9月25日凌晨,高通第五代骁龙8至尊版正式发布,即骁龙8 Elite Gen 5、骁龙8E5、SM8850-AC。它是骁龙8至尊版的迭代,宣称是全球最快的移动CPU(现在最强的CPU多核性能)。
研究人员通过 API 密钥模式和提示符结构识别了该恶意软件,并发现了新的样本和其他攻击性 LLM 用途,例如人员搜索代理、红队工具和 LLM 辅助的漏洞注入实用程序。
llm 恶意软件 malterminal 先驱malterm 2025-09-24 16:43 7
在今天开幕的2025云栖大会上,阿里云推出系列新产品和服务,包括全新的AI服务器、开源大模型、更广阔的全球数据中心建设等,凸显出阿里云在AI布局上“夯实基础、繁荣生态”的双轮驱动力。
Fay是一个开源的 MCP 框架,能让“数字人”(2.5D、3D、移动端、PC、网页等形式)或者大语言模型(兼容 OpenAI、DeepSeek 等)与业务系统连接、互动与部署。换句话说,如果你想让一个虚拟人/数字角色能够听你说、理解你说、讲话、执行命令/连接
最近,来自伦敦的初创公司Plumerai宣布完成870 万美元 (约合6200万人民币)A 轮融资,累计融资接近 1700 万美元。新资金将主要用于拓展Tiny AI技术在摄像头等边缘设备上的落地,并探索将视觉语言模型(Vision + Language)与设
Model Context Protocol(MCP)作为 AI 应用生态系统中的关键协议,为大语言模型与外部工具、数据源的集成提供了标准化接口。随着 MCP 在企业级应用中的快速普及,其安全风险也日益凸显。构建一套智能化的 MCP 安全扫描系统,不仅是技术发
在硅谷HotChips2025大会上,有个大人物一开口就把AI圈的底给透了,他就是NoamShazeer,既是Transformer模型的爹之一,也是谷歌搜索拼写校正的幕后推手,在LLM领域扎了快十年。